期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于细粒度特征的话题句识别方法
蒋玉茹 宋柔
计算机应用    2014, 34 (5): 1345-1349.   DOI: 10.11772/j.issn.1001-9081.2014.05.1345
摘要318)      PDF (739KB)(356)    收藏

话题句(TC)识别中采用穷举方法生成标点句的候选话题句(CTC)影响系统的执行效率和话题句识别的准确率。提出一种新的候选话题句生成方法,利用标点句在篇章中的位置特征、话题的语法特征以及话题串与说明的邻接性特征,指导候选话题句的生成过程。实验结果表明,该方法减少了候选话题句的个数,提高了系统效率。而且,通过与基于穷举式候选话题句生成策略的话题句识别工作进行对比,该方法使单个标点句话题句识别的准确率提高了0.96个百分点,使标点句序列话题句识别的准确率提高了1.31个百分点。

参考文献 | 相关文章 | 多维度评价
2. 基于无监督学习的专业领域分词歧义消解方法
修驰 宋柔
计算机应用    2013, 33 (03): 780-783.   DOI: 10.3724/SP.J.1087.2013.00780
摘要753)      PDF (629KB)(520)    收藏
中文自然语言处理中专业领域分词的难度远远高于通用领域。特别是在专业领域的分词歧义方面,一直没有找到有效的解决方法。针对该问题提出基于无监督学习的专业领域分词歧义消解方法。以测试语料自身的字符串频次信息、互信息、边界熵信息为分词歧义的评价标准,独立、组合地使用这三种信息解决分词歧义问题。实验结果显示该方法可以有效消解专业领域的分词歧义,并明显提高分词效果。
参考文献 | 相关文章 | 多维度评价